智能论文笔记

Curvature regularization for Non-line-of-sight Imaging from Under-sampled Data

Rui Ding , Juntian Ye , Qifeng Gao , Feihu Xu , Yuping Duan

分类：计算机视觉

2023-01-01

Non-line-of-sight (NLOS) imaging aims to reconstruct the three-dimensional hidden scenes from the data measured in the line-of-sight, which uses photon time-of-flight information encoded in light after multiple diffuse reflections. The under-sampled scanning data can facilitate fast imaging. However, the resulting reconstruction problem becomes a serious ill-posed inverse problem, the solution of which is of high possibility to be degraded due to noises and distortions. In this paper, we propose two novel NLOS reconstruction models based on curvature regularization, i.e., the object-domain curvature regularization model and the dual (i.e., signal and object)-domain curvature regularization model. Fast numerical optimization algorithms are developed relying on the alternating direction method of multipliers (ADMM) with the backtracking stepsize rule, which are further accelerated by GPU implementation. We evaluate the proposed algorithms on both synthetic and real datasets, which achieve state-of-the-art performance, especially in the compressed sensing setting. All our codes and data are available at https://github.com/Duanlab123/CurvNLOS.

translated by 谷歌翻译

Adaptive Perturbation Generation for Multiple Backdoors Detection

Yuhang Wang , Huafeng Shi , Rui Min , Ruijia Wu , Siyuan Liang , Yichao Wu , Ding Liang , Aishan Liu

分类：计算机视觉

2022-09-12

大量证据表明，深神经网络（DNN）容易受到后门攻击的影响，这激发了后门检测方法的发展。现有的后门检测方法通常是针对具有单个特定类型（例如基于补丁或基于扰动）的后门攻击而定制的。但是，在实践中，对手可能会产生多种类型的后门攻击，这挑战了当前的检测策略。基于以下事实：对抗性扰动与触发模式高度相关，本文提出了自适应扰动生成（APG）框架，以通过自适应注射对抗性扰动来检测多种类型的后门攻击。由于不同的触发模式在相同的对抗扰动下显示出高度多样的行为，因此我们首先设计了全球到本地策略，以通过调整攻击的区域和预算来适应多种类型的后门触发器。为了进一步提高扰动注入的效率，我们引入了梯度引导的掩模生成策略，以寻找最佳区域以进行对抗攻击。在多个数据集（CIFAR-10，GTSRB，Tiny-Imagenet）上进行的广泛实验表明，我们的方法以大幅度优于最先进的基线（+12％）。

translated by 谷歌翻译

Rethinking Skip Connections in Encoder-decoder Networks for Monocular Depth Estimation

Zhitong Lai , Haichao Sun , Rui Tian , Nannan Ding , Zhiguo Wu , Yanjie Wang

分类：计算机视觉 | 人工智能

2022-08-29

跳过连接是编码器网络中的基本单元，能够改善神经网络的特征宣传。但是，大多数带有跳过连接的方法仅连接了编码器和解码器中相同分辨率的连接功能，这忽略了编码器中的信息损失，而图层的进度更深。为了利用编码器较浅层中特征的信息损失，我们提出了一个完整的跳过连接网络（FSCN），以实现单眼深度估计任务。此外，要更接近跳过连接中的功能，我们提出了一个自适应串联模块（ACM）。此外，我们对FSCN和FSCN的室内和室内数据集（即Kitti Dataste和NYU DEPTH DATASET）进行了广泛的实验。

translated by 谷歌翻译

HTML版本

LRIP-Net: Low-Resolution Image Prior based Network for Limited-Angle CT Reconstruction

Qifeng Gao , Rui Ding , Linyuan Wang , Bin Xue , Yuping Duan

分类：计算机视觉

2022-07-30

在计算机断层扫描成像的实际应用中，投影数据可以在有限角度范围内获取，并由于扫描条件的限制而被噪声损坏。嘈杂的不完全投影数据导致反问题的不良性。在这项工作中，我们从理论上验证了低分辨率重建问题的数值稳定性比高分辨率问题更好。在接下来的内容中，提出了一个新型的低分辨率图像先验的CT重建模型，以利用低分辨率图像来提高重建质量。更具体地说，我们在下采样的投影数据上建立了低分辨率重建问题，并将重建的低分辨率图像作为原始限量角CT问题的先验知识。我们通过交替的方向方法与卷积神经网络近似的所有子问题解决了约束最小化问题。数值实验表明，我们的双分辨率网络在嘈杂的有限角度重建问题上的变异方法和流行的基于学习的重建方法都优于变异方法。

translated by 谷歌翻译

Perception-Aware Attack: Creating Adversarial Music via Reverse-Engineering Human Perception

Rui Duan , Zhe Qu , Shangqing Zhao , Leah Ding , Yao Liu , Zhuo Lu

分类：人工智能 | 机器学习

2022-07-26

最近，对抗机器学习攻击对实用音频信号分类系统构成了严重的安全威胁，包括语音识别，说话者识别和音乐版权检测。先前的研究主要集中在确保通过在原始信号上产生类似小噪声的扰动来攻击音频信号分类器的有效性。目前尚不清楚攻击者是否能够创建音频信号扰动，除了其攻击效果外，人类还可以很好地看待。这对于音乐信号尤其重要，因为它们经过精心制作，具有可让人的音频特征。在这项工作中，我们将对音乐信号的对抗性攻击作为一种新的感知攻击框架，将人类研究纳入对抗性攻击设计中。具体而言，我们进行了一项人类研究，以量化人类对音乐信号的变化的看法。我们邀请人类参与者根据对原始和扰动的音乐信号对进行评分，并通过回归分析对人类感知过程进行反向工程，以预测给定信号的人类感知的偏差。然后将感知感知的攻击作为优化问题提出，该问题找到了最佳的扰动信号，以最大程度地减少对回归人类感知模型的感知偏差的预测。我们使用感知感知的框架来设计对YouTube版权探测器的现实对抗音乐攻击。实验表明，感知意识攻击会产生对抗性音乐的感知质量明显优于先前的工作。

translated by 谷歌翻译

Static and Dynamic Concepts for Self-supervised Video Representation Learning

Rui Qian , Shuangrui Ding , Xian Liu , Dahua Lin

分类：计算机视觉 | 机器学习

2022-07-26

在本文中，我们提出了一种新颖的学习方案，用于自我监督的视频表示学习。受到人类如何理解视频的激励，我们建议先学习一般视觉概念，然后参加歧视性的局部区域以进行视频理解。具体而言，我们利用静态框架和框架差异来帮助解开静态和动态概念，并分别使潜在空间中的概念分布对齐。我们增加了多样性和忠诚的正常化，以确保我们学习一套紧凑的有意义的概念。然后，我们采用跨注意机制来汇总不同概念的详细局部特征，并滤除具有低激活的冗余概念以执行局部概念对比。广泛的实验表明，我们的方法提炼有意义的静态和动态概念来指导视频理解，并在UCF-101，HMDB-51和潜水-48上获得最新的结果。

translated by 谷歌翻译

XInsight: eXplainable Data Analysis Through The Lens of Causality

Pingchuan Ma , Rui Ding , Shuai Wang , Shi Han , Dongmei Zhang

分类：人工智能

2022-07-26

鉴于探索性数据分析的日益普及（EDA），了解EDA获得的知识的基本原因至关重要，但仍未进行研究。这项研究首次促进了对数据分析的透明且可解释的观点，称为可解释的数据分析（XDA）。 XDA提供了有关因果和非因果语义的定性和定量解释的数据分析。这样，XDA将显着提高人类对数据分析结果的理解和信心，从而促进现实世界中准确的数据解释和决策。为此，我们提出Xinsight，这是XDA的一般框架。 Xinsight是一种旨在提取因果图，将因果原语转化为XDA语义的三模块，端到端管道，并量化每个解释对数据事实的定量贡献。 Xinsight使用一组设计概念和优化来解决与将因果集成到XDA中相关的固有困难。关于合成和现实世界数据集以及人类评估的实验证明了Xinsight的高度有希望的能力。

translated by 谷歌翻译

Dual Contrastive Learning for Spatio-temporal Representation

Shuangrui Ding , Rui Qian , Hongkai Xiong

分类：计算机视觉

2022-07-12

对比学习表明，在自我监督时空表示学习中有希望的潜力。大多数作品天真地采样不同的剪辑以构建正面和负对。但是，我们观察到该公式将模型倾向于背景场景偏见。根本原因是双重的。首先，场景差异通常比运动差异更明显，更容易区分。其次，从同一视频中采样的剪辑通常具有相似的背景，但具有不同的动作。仅将它们作为正对就可以将模型绘制为静态背景而不是运动模式。为了应对这一挑战，本文提出了一种新颖的双重对比配方。具体而言，我们将输入RGB视频序列分解为两种互补模式，静态场景和动态运动。然后，将原始的RGB功能分别靠近静态特征和对齐动态特征。这样，将静态场景和动态运动同时编码为紧凑的RGB表示。我们通过激活图进一步进行特征空间解耦，以提炼静态和动态相关的特征。我们将我们的方法称为\ textbf {d} ual \ textbf {c} intrastive \ textbf {l} ginal for spatio-tempormal \ textbf {r} ePresentation（dclr）。广泛的实验表明，DCLR学习有效的时空表示，并在UCF-101，HMDB-51和潜水-48数据集中获得最先进或可比性的性能。

translated by 谷歌翻译

Statistical Learning for Individualized Asset Allocation

Yi Ding , Yingying Li , Rui Song

分类： (统计)机器学习

2022-01-20

我们为个性化资产分配建立了高维统计学习框架。我们提出的方法可以解决具有大量特征的连续行动决策。我们开发了一种离散化方法，以模拟连续动作的效果，并允许离散频率很大，并且与观测值的数量分歧。使用惩罚回归估算连续行动的价值函数，并通过我们提出的广义惩罚对模型系数的线性转换施加。我们表明，我们提出的离散和回归是在效应不连续性（Drove）方法上以广义折叠式惩罚（DROVE）方法具有理想的理论属性，并允许对与最佳决策相关的最佳价值进行统计推断。从经验上讲，提出的框架是通过健康和退休研究数据来寻找个性化最佳资产分配的。结果表明，我们个性化的最佳战略改善了人口财务状况。

translated by 谷歌翻译

A Sparse Expansion For Deep Gaussian Processes

Liang Ding , Rui Tuo , Shahin Shahrampour

分类： (统计)机器学习 | 机器学习

2021-12-11

深度高斯进程（DGP）使非参数方法能够量化复杂深机器学习模型的不确定性。 DGP模型的传统推理方法可以遭受高计算复杂性，因为它们需要使用核矩阵的大规模操作进行训练和推理。在这项工作中，我们提出了一种基于一系列高斯过程的准确推理和预测的有效方案，称为Tensor Markov高斯过程（TMGP）。我们构建称为分层扩展的TMGP的诱导近似。接下来，我们开发一个深入的TMGP（DTMGP）模型作为TMGPS的多个层次扩展的组成。所提出的DTMGP模型具有以下性质：（1）每个激活功能的输出是确定性的，而重量独立于标准高斯分布选择; （2）在训练或预测中，只有O（Polylog（M））（M）激活函数具有非零输出，这显着提高了计算效率。我们对实时数据集的数值实验显示了DTMGP与其他DGP型号的卓越计算效率。

translated by 谷歌翻译